iT邦幫忙

2024 iThome 鐵人賽

DAY 14
0

一、前言

前篇文章提及了網頁擷取完整 HTML 表格的功能,此篇文章則將使用同樣功能的不同元素進行網頁資料爬蟲,並抓取電商網站上的產品資訊。常見情境可能有需要定期爬取競品資訊,或是商品上架後需要進行統整等,屬於 RPA 中很實用卻又不難操作的情境。

二、示範情境

假設你想要從某個電商網站上抓取產品列表資訊,包括產品名稱、價格以及其他相關細節。手動操作可能十分繁瑣,但透過 Power Automate Desktop 的自動化功能,你可以輕鬆完成這項任務。

流程設計

假設你想要從某個電商網站上抓取產品列表資訊,包括產品名稱、價格以及其他相關細節。手動操作可能十分繁瑣,但透過 Power Automate Desktop 的自動化功能,則可讓一切都更快速。

此次採用的實作步驟很簡單,僅有三個動作,目的要讓 RPA 自動到 PChome 抓取「限時瘋搶」的商品名稱及價格資訊,並將這些資訊直接儲存至 Excel。

步驟設計:

  1. 啟動新的 Microsoft Edge:使用瀏覽器自動化,開啟目標 PChome 網站。

  2. 從網頁擷取資料:透過 Power Automate Desktop 的 UI 元素擷取功能,自動抓取產品名稱和價格。

  3. 儲存 Excel:將抓取到的資料匯出到 Excel 文件,便於進行後續分析或保存。

參考流程畫面

https://ithelp.ithome.com.tw/upload/images/20240926/201694590Byiauhj78.png

參考影片

三、使用功能說明

這次重點說明之前未曾提及的動作內容,分別是「從網頁擷取資料」和「儲存 Excel」

1. 從網頁擷取資料

進入 PChome 網站後,使用從網頁擷取資料的功能,並切換至網頁視窗。在「限時瘋搶」區域的目標抓取商品名稱欄位點擊右鍵後,選取「擷取元素值」,點擊後可以看到這邊有很多不同種類,我們這邊以抓取文字值為示範。點擊後可以接著點選下一個同樣欄位的商品,就會發現全部的同欄位商品清單都被自動抓進表格了。

假設除了商品名稱外,還需要抓取價格,那也是同樣的步驟,滑鼠移到價格欄位點擊右鍵後,一樣選取「擷取元素值」→「抓取文字值」,同樣繼續抓取下個商品的價格,就會發現全部的同欄位商品價格也都被抓進表格了。

接著回到 Power Automate Desktop 的流程編輯介面,一樣我們把儲存資料模式選取為 Excel 試算表。
https://ithelp.ithome.com.tw/upload/images/20240926/20169459LVSke3Oc1f.png
參考影片

2. 儲存 Excel

最後一步驟,因為前一步驟的儲存資料並沒有實際貼到「實體的」Excel,所以在此新增一個儲存 Excel 動作,把剛才從 PChome 抓取的商品資訊儲存進 Excel 就完成了。

四、小結

為什麼電商商品明明就不是表格,卻可以輕鬆的自動抓取類似欄位抓進 Excel 乖巧地規律貼上呢?原因是這些商品雖然看起來很像互不干涉的「獨立個體」,然實則卻是同個「家族」,所以 RPA 才能智能地透過抓取 2-3 個類似商品,進而抓取到所有的同類型商品資訊。

換言之,假設同個網址中,除了「限時瘋搶」外,還有其他的商品區域,舉例可能另有一個「熱銷商品區」,那即便兩個商品區塊都在同網址中,仍然會需要另外提供不同的規則以進行抓取動作。

文章同步刊載於此


上一篇
Power Automate Desktop:網頁瀏覽器資料擷取
下一篇
Power Automate Desktop:克服常見網頁元素抓取錯誤 - RPA Challenge(1)
系列文
30 天打造 RPA 自動化流程:Power Automate 從入門到實戰26
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言